Rank in Wordlist | Frequency | Word |
---|---|---|
396 | 33 | из-за |
566 | 26 | что-то |
1140 | 14 | кто-то |
1308 | 12 | Accept-Encoding |
1376 | 12 | какой-то |
1476 | 11 | Во-первых |
1872 | 9 | Во-вторых |
2153 | 8 | Content-Length |
2158 | 8 | X-Powered-By |
2616 | 7 | где-то |
2774 | 7 | по-настоящему |
2964 | 6 | 1-2 |
2981 | 6 | |
3015 | 6 | Из-за |
3048 | 6 | Пресс-служба |
3189 | 6 | как-то |
3191 | 6 | какие-то |
3192 | 6 | каких-либо |
3373 | 6 | пресс-конференции |
3544 | 6 | чем-то |
Rank in Wordlist | Frequency | Word |
---|---|---|
2158 | 8 | X-Powered-By |
3572 | 5 | 940-90-48 |
4657 | 4 | Нексию-Матис-Дамас-Тико-Спарк |
6009 | 3 | 2008-05-18 |
8624 | 2 | 04-12-2011 |
8694 | 2 | 2008-06-27 |
8768 | 2 | AL-MUAXXIR-SERVIS |
8832 | 2 | GUL-REN-TEKS→ |
14891 | 1 | 02-Ноя-2013 |
14892 | 1 | 02-Фев-2012 |
Rank in Wordlist | Frequency | Word |
---|---|---|
4657 | 4 | Нексию-Матис-Дамас-Тико-Спарк |
15684 | 1 | 4-4-1-1 |
17389 | 1 | X-Powered-By-Plesk |
18022 | 1 | «Навои-Нарпай-Пархона-Обронон» |
18556 | 1 | Авто-Грузо-Пасс-Транс |
20503 | 1 | Кандым-Хаузак-Шады-Кунград |
22987 | 1 | Санта-фе-де-Богота |
23777 | 1 | Узбекистан-Туркменистан-Иран-Оман-Катар |
32068 | 1 | лета-а-а-ть |
40657 | 1 | рынка-Евро-Дом- |
Rank in Wordlist | Frequency | Word |
---|---|---|
4657 | 4 | Нексию-Матис-Дамас-Тико-Спарк |
23777 | 1 | Узбекистан-Туркменистан-Иран-Оман-Катар |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters